首页> 外文OA文献 >Enriching CHILDES for Morphosyntactic Analysis
【2h】

Enriching CHILDES for Morphosyntactic Analysis

机译:浓缩智利进行形态学分析

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The current paper examines a particular approach to morphosyntactic analysis that has been elaborated in the context of the CHILDES (Child Language Data Exchange System) database. Readers unfamiliar with this database and its role in child language acquisition research may find it useful to download and study the materials (manuals, programs, and database) that are available for free over the web at http://childes.psy.cmu.edu. However, before doing this, users should read the \u22Ground Rules\u22 for proper usage of the system. This database now contains over 44 million spoken words from 28 different languages. In fact, CHILDES is the largest corpus of conversational spoken language data currently in existence. In terms of size, the next largest collection of conversational data is the British National Corpus with 5 million words. What makes CHILDES a single corpus is the fact that all of the data in the system are consistently coded using a single transcript format called CHAT. Moreover, for several languages, all of the corpora have been tagged for part of speech using an automatic tagging program called MOR.
机译:本文研究了一种特殊的形态句法分析方法,该方法已在CHILDES(儿童语言数据交换系统)数据库的背景下进行了阐述。不熟悉此数据库及其在儿童语言习得研究中的作用的读者可能会发现,通过http://childes.psy.cmu网站免费下载和研究可免费获取的资料(手册,程序和数据库)非常有用。 edu。但是,在执行此操作之前,用户应阅读\ u22Ground Rules \ u22以正确使用系统。该数据库现在包含来自28种不同语言的超过4,400万个口语单词。实际上,CHILDES是当前存在的最大的会话口语数据集。就规模而言,第二大的会话数据收集是拥有500万个单词的英国国家语料库。使CHILDES成为单一语料库的原因是,系统中的所有数据都使用称为CHAT的单一抄本格式一致地编码。此外,对于几种语言,已使用称为MOR的自动标记程序对所有语料库进行了词性标记。

著录项

  • 作者

    MacWhinney, Brian;

  • 作者单位
  • 年度 2009
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号